期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于LDA主题模型的短文本分类方法
张志飞 苗夺谦 高灿
计算机应用    2013, 33 (06): 1587-1590.   DOI: 10.3724/SP.J.1087.2013.01587
摘要2354)      PDF (555KB)(3465)    收藏
针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下文,降低权重;另一方面关联不同词以减少稀疏性,增加权重。采用K近邻方法对自动抓取的网易页面标题数据进行分类,实验表明新方法在分类性能上比传统的向量空间模型和基于主题的相似性度量分别高5%和2.5%左右。
参考文献 | 相关文章 | 多维度评价
2. 粗糙集信度一致属性约简
高灿 苗夺谦 张志飞 张红云
计算机应用    2012, 32 (04): 1067-1069.   DOI: 10.3724/SP.J.1087.2012.01067
摘要1026)      PDF (612KB)(398)    收藏
为了消除现有概率粗糙集模型约简过程中出现的诸多约简异常问题,通过引入对象最大信度概念,提出了非参与带参最大决策熵属性约简模型,阐明了带参最大决策熵测度的单调性,给出了带参最大决策熵核和相对不必要属性的定义,并分析了其约简与已有概率粗糙集模型约简的关系。其次将对象置信度引入差别矩阵,构建了带参与非参信度差别矩阵,讨论了其定义与经典差别矩阵对不确定对象刻画的差异性。最后运用实例验证了方法的有效性。
参考文献 | 相关文章 | 多维度评价